动态特征选择算法能够大幅提升处理动态数据的效率,然而目前基于模糊粗糙集的无监督的动态特征选择算法较少。针对上述问题,提出一种特征分批次到达情况下的基于模糊粗糙集的无监督动态特征选择(UDFRFS)算法。首先,通过定义伪三角范数和新的相似关系在已有数据的基础上进行模糊关系值的更新过程,从而减少不必要的运算过程;其次,通过利用已有的特征选择结果,在新的特征到达后,使用依赖度判断原始特征部分是否需要重新计算,以减少冗余的特征选择过程,从而进一步提高特征选择的速度。实验结果表明,UDFRFS相较于静态的基于依赖度的无监督模糊粗糙集特征选择算法,在时间效率方面能够提升90个百分点以上,同时保持较好的分类精度和聚类表现。
针对大气中细颗粒物(PM2.5)浓度预测的问题,提出一种预测模型。首先,通过引入综合气象指数综合考虑风力、湿度、温度等因素;然后,结合实际二氧化硫(SO2)浓度、二氧化氮(NO2)浓度、一氧化碳(CO)浓度和PM10浓度等,构成特征向量;最后,利用特征向量和PM2.5浓度数据来建立最小二乘支持向量机(LS-SVM)预测模型。经2013年城市A和城市B环境监测中心的数据预测分析表明,引入综合气象指数后预测的准确性提高,误差降低近30%。说明该模型能够较为准确地预测PM2.5浓度,并具有较高的泛化能力。此外还分析了PM2.5浓度与住院率、医院门诊量的关系,发现了它们的高度相关性。